네할렘 (마이크로아키텍처)
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
네할렘은 인텔이 개발한 마이크로아키텍처로, 펜티엄 III 및 펜티엄 4 개발팀이 담당했다. 하이퍼 스레딩 기술을 통해 최대 8개의 코어와 16개의 스레드를 지원하며, 45나노미터 공정으로 시작하여 웨스트미어에서 32나노미터로 전환되었다. 네할렘은 펜티엄 프로 이후 인텔의 아키텍처에서 큰 변화를 가져왔으며, L3 캐시를 모든 코어가 공유하도록 설계되었다. 네할렘은 성능 향상과 에너지 효율성을 목표로 개발되었으며, 웨스트미어는 네할렘의 후속 제품으로 6코어 프로세서와 AES-NI 기술을 지원한다. 네할렘은 블룸필드, 린필드, 클락데일 등 다양한 코드명으로 출시되었으며, 후속 아키텍처는 샌디 브리지이다.
더 읽어볼만한 페이지
- 인텔 마이크로아키텍처 - 그레이스몬트 (마이크로아키텍처)
그레이스몬트는 인텔 7 제조 공정을 기반으로 하여 향상된 명령어 처리 능력, 확장된 캐시 메모리, 개선된 분기 예측 기능 등을 제공하는 4세대 저전력 아톰 마이크로아키텍처이며, 앨더 레이크와 랩터 레이크 하이브리드 프로세서의 효율 코어 및 앨더 레이크-N 라인업의 코어 클러스터로 사용된다. - 인텔 마이크로아키텍처 - 넷버스트
넷버스트는 인텔이 더 높은 클럭 속도와 새로운 명령어 세트를 목표로 개발했으나 높은 발열과 전력 소비 문제로 중단된 마이크로아키텍처로, 펜티엄 4와 펜티엄 D 프로세서에 적용되었다. - 인텔의 마이크로프로세서 - 인텔 80386
인텔 80386은 1985년 출시된 x86 아키텍처의 32비트 마이크로프로세서로, 온칩 메모리 관리 장치, 3단계 파이프라인, 세 가지 동작 모드를 제공하며, 개인용 컴퓨터와 임베디드 시스템에 널리 사용되었지만 현재는 생산 및 지원이 중단되었고, 32비트 명령어 집합은 현대 x86 아키텍처의 기반이 되었다. - 인텔의 마이크로프로세서 - 인텔 4004
인텔 4004는 1971년 인텔에서 출시된 세계 최초의 상용 마이크로프로세서 중 하나이며, 4비트 아키텍처를 기반으로 계산기 라인에 탑재하기 위해 개발되었고, 컴퓨터 소형화와 개인용 컴퓨터 시대에 기여했다. - 인텔 x86 마이크로프로세서 - 인텔 80386
인텔 80386은 1985년 출시된 x86 아키텍처의 32비트 마이크로프로세서로, 온칩 메모리 관리 장치, 3단계 파이프라인, 세 가지 동작 모드를 제공하며, 개인용 컴퓨터와 임베디드 시스템에 널리 사용되었지만 현재는 생산 및 지원이 중단되었고, 32비트 명령어 집합은 현대 x86 아키텍처의 기반이 되었다. - 인텔 x86 마이크로프로세서 - 인텔 4004
인텔 4004는 1971년 인텔에서 출시된 세계 최초의 상용 마이크로프로세서 중 하나이며, 4비트 아키텍처를 기반으로 계산기 라인에 탑재하기 위해 개발되었고, 컴퓨터 소형화와 개인용 컴퓨터 시대에 기여했다.
네할렘 (마이크로아키텍처) | |
---|---|
마이크로아키텍처 정보 | |
이름 | 네할렘 |
![]() | |
출시일 | 2008년 11월 11일 |
코어 수 | 1-6 (제온은 1-8) |
트랜지스터 수 | 7억 3100만 ~ 23억 (45 나노미터) |
클럭 속도 | 1.06 GHz ~ 3.33 GHz |
L1 캐시 | 코어당 64KB (데이터 32KB + 명령어 32KB) |
L2 캐시 | 코어당 256KB |
L3 캐시 | 2MB ~ 24MB (공유) |
DMI 속도 (최저) | 2 |
QPI 속도 (최저) | 4.80 |
QPI 속도 (최고) | 6.40 |
아키텍처 | x86-16, IA-32, x86-64 |
마이크로아키텍처 | 네할렘 |
명령어 세트 | MMX, SSE, SSE2, SSE3, SSSE3, SSE4, SSE4.1, SSE4.2 |
확장 기능 | VT-x, VT-d |
소켓 | LGA 1156, LGA 1366, LGA 1567, μPGA 988 |
이전 | Core (Tock), Penryn (Tick) |
이후 | Westmere (Tick), Sandy Bridge (Tock) |
크기 기준 | 45 nm |
지원 상태 | 지원 중단 |
판매사 | Intel |
설계 회사 | Intel |
제조사 | Intel |
모델 | Core i5-7xx, Core i7-8xx, Core i7-9xx Extreme, Xeon 3000/5000/7000, Mobile Core i7-7xxQM, Mobile Core i7-8xxQM, Mobile Core i7-9xxXM Extreme |
코어 | Clarksfield, Lynnfield, Bloomfield, Jasper Forest, Gainestown (Nehalem-EP), Beckton (Nehalem-EX), Aubrurndale, Havendale |
P코드 | NHM |
2. 역사
네할렘 마이크로아키텍처는 펜티엄 III 및 펜티엄 4를 개발했던 미국 오리건주 힐스보로 팀이 개발을 담당했다. (기존 코어 마이크로아키텍처는 이스라엘 하이파 개발팀)[41] 초기에는 넷버스트 마이크로아키텍처의 확장으로 알려졌으나, 넷버스트의 실패 이후 대폭적인 설계 변경이 이루어진 것으로 보인다.
기존 인텔 쿼드코어는 CPU 하나에 다이 두 개가 있었지만, 네할렘은 모놀리딕 설계로 다이 하나에 코어 4개를 집적했다. 이전 넷버스트 마이크로아키텍처에서 사용했던 하이퍼스레딩 기술이 네할렘에 다시 적용되어, 코어 4개를 가진 쿼드코어 CPU는 운영체제에서 최대 8개 스레드를 동시에 처리하는 옥타코어처럼 작동한다. 이로 인해 멀티스레딩 환경에서 코어 마이크로아키텍처보다 성능이 크게 향상되었다.[41]
얼마 후, 네할렘은 하나의 프로세서에 1개부터 8개까지의 코어와 하이퍼 스레딩 기술을 구현한다고 발표했다. 이를 통해 코어당 2개의 스레드, 프로세서 전체에서 16개의 스레드를 처리할 수 있게 되었다.[41]
3. 기술
메모리 컨트롤러 내장과 퀵패스 인터커넥트 기술은 성능 향상에 큰 영향을 미쳤다. 멀티 코어로 발생하는 병목 현상을 줄이기 위해 메모리 컨트롤러를 CPU에 내장하고 퀵패스 인터커넥트 기술로 통신하여 메모리 대역폭을 늘리고 병목 현상을 줄였다. DDR3 SDRAM을 사용하는 2~4채널 메모리 컨트롤러가 CPU에 통합되었고, FSB를 대체하는 새로운 전송 프로토콜인 퀵패스 인터커넥트를 개발하여 사용하였다. 이러한 플랫폼 아키텍처 혁신으로 코어 마이크로아키텍처에 비해 메모리 읽기 속도가 최대 약 4배 향상되었다.
네할렘 마이크로아키텍처는 확장성이 뛰어나 인텔이 1995년에 선보인 펜티엄 프로만큼이나 의미 있는 변화를 가져왔다.
네할렘의 주요 기술적 특징은 다음과 같다.
캐시 | 페이지 크기 | ||
---|---|---|---|
이름 | 레벨 | 4 KB | 2 MB |
DTLB | 1st | 64 | 32 |
ITLB | 1st | 128 | 7 / 논리 코어 |
STLB | 2nd | 512 | 없음 |
코어 마이크로아키텍처에서 CPU 코어 자체 설계를 대폭 변경했다. 캐시 시스템도 개선되어 L1 캐시는 명령과 데이터 각각 32KB로 총 64KB이다. 레이턴시 증가가 문제였던 L2 캐시는 코어당 256KB로 축소하고 레이턴시를 줄였으며, 모든 코어에서 공유하는 대용량 L3 캐시를 배치했다. L3 캐시 용량은 제품마다 다르다.
프로세서에 DDR3 SDRAM 메모리 컨트롤러를 2~4채널 통합했다. MP 플랫폼 서버용 Nehalem-EX (Beckton)에는 FB-DIMM2 메모리 컨트롤러 4ch를 통합했지만, 마더보드 위 별도 칩에서 DDR3 SDRAM 메모리 컨트롤러로 변환하는 형태로 제품화되었다.
4. 성능 및 소비전력 향상
네할렘은 펜린 대비 다음과 같은 성능 및 소비전력 개선을 이루었다.
- 동일 소비전력에서 싱글 스레드 애플리케이션은 1.1배에서 1.25배, 멀티 스레드 애플리케이션은 1.2배에서 2배 이상 성능 향상을 보였다.[44]
- 동일 성능에서 30% 낮은 소비전력을 보였다.[44]
- 코어만의 성능을 비교했을 때 동일 클럭 대비 15%-20% 성능 향상을 제공했다.[44]
- AnandTech에 의하면 “10% 소비전력 증가로 20–30% 전반적인 성능 향상이 예상”된다고 한다.[44]
- 네할렘 마이크로아키텍처 기반 제온 프로세서는 인텔 제온 X5365 프로세서 3.0GHz와 비교했을 때 SPECint_rate2006에서 1.6배, SPECfp_rate_2006에서 2.4배의 높은 성능을 보인다고 ''PC Watch''는 전한다.[45]
- 7개의 새로운 SIMD 명령어가 추가된 SSE 4.2를 지원하는 첫 프로세서이다.
- 펜린과 비교하여 동일한 전력 수준에서 10~25% 향상된 싱글 스레드 성능, 20~100% 향상된 멀티 스레드 성능을 보였다.
- 동일한 성능에 대해 30% 감소된 전력 소비를 보였다.
- 평균적으로 코어당 15~20%의 클럭당 성능 향상을 제공한다.
- 인텔 터보 부스트 기술이 탑재되어 성능과 소비 전력의 처리량 개선에 기여하고 있다.
기존 인텔 쿼드코어는 하나의 CPU에 두 개의 다이가 존재했지만, 네할렘은 모놀리딕으로 설계되어 하나의 다이에 4개 코어가 집적되었다. 또한 이전의 넷버스트 마이크로아키텍처에서 사용하던 하이퍼스레딩 기술이 네할렘에 다시 적용되어 4개 코어가 하나의 CPU에 집적된 쿼드코어는 운영체제 상에서는 옥타코어인 것처럼 최대 8개 스레드를 동시에 처리할 수 있게 되어 멀티스레딩 환경에서 코어 마이크로아키텍처와 비교해 성능이 월등히 향상되었다.[41]
가장 큰 성능 향상에 기여한 변화는 메모리 컨트롤러 내장과 퀵패스 인터커넥트 기술이다. 멀티 코어로 진입하면서 병목현상이 발생하는 주요 지점이었던 메모리 부분을 메모리 컨트롤러를 CPU 내에 내장하고 퀵패스 인터커넥트 기술로 통신을 하게 되어, 메모리 대역폭이 향상되고 병목 현상이 획기적으로 줄었다. DDR3 SDRAM을 사용하는 2~4채널 메모리 컨트롤러가 CPU 내에 집적되었으며, 이에 맞게 FSB를 대신할 퀵패스 인터커넥트라는 새로운 전송 프로토콜을 개발하여 사용하였다. 이러한 플랫폼 아키텍처의 혁신으로 기존 코어 마이크로아키텍처와 비교했을 때 메모리 읽기 속도의 경우에는 최대 약 4배의 속도 향상을 보여준다.
네할렘 프로세서는 SSE4.2 SIMD 명령어를 통합하여, Core 2 시리즈의 SSE 4.1 세트에 7개의 새로운 명령어를 추가했다. 네할렘 아키텍처는 `LOCK CMPXCHG` 비교 및 교환 명령어와 같은 원자적 연산에 대한 오버헤드를 제거하기 위해 원자적 연산 지연 시간을 50% 줄였다.[15]
5. 웨스트미어
'''웨스트미어'''(Westmere|웨스트미어영어)는 네할렘의 후속 프로세서로서 45 nm에서 32 nm로 공정 기술을 축소시켰다. 그렇지만 동일한 네할렘 마이크로아키텍처를 사용한다. 첫 웨스트미어 기반 프로세서는 2010년 1월 7일에 출시된 코어 i3, 코어 i5와 듀얼코어 모바일 코어 i7 계열 프로세서이다.
웨스트미어의 기능과 향상된 점은 다음과 같다.
- 6 코어 프로세서[46]
- AES(Advanced Encryption Standard) 암호화/복호화 성능을 3배 이상 제공하는 새로운 명령어 집합, AES-NI(Advanced Encryption Standard-New Instructions)[47]
- * 7개의 새로운 AES 명령어 집합(AES-NI)을 제공하며, AES 알고리즘 처리에 사용된다. 이 명령어들은 프로세서가 하드웨어적으로 암호화 수행을 가속하여 더 빠른 실행을 할 뿐만 아니라 소프트웨어적인 공격으로부터 보호한다.
- 노트북, 데스크톱용 프로세서는 그래픽 처리 엔진을 내장
- 가상화 대기시간을 줄임으로써 가상화 성능 향상[48]
- 새로운 가상화 기능: “VMX 비제한 모드 지원”. 이것은 16비트 게스트 OS가 실행되도록 허용(real mode and big real mode)
- 1GiB 크기의 아주 커다란 페이지 지원
6. 코드 이름
UP 서버
4-채널
80604
3-채널
80601
80602
2-채널, PCIe
80607
80605
80612
2-채널, PCIe, 그래픽 코어
canceled
canceled
4-채널[49]
80615
3-채널
80613
80614
2-채널, PCIe, 그래픽 코어
80617
80616